Affine correspondences have traditionally been used to improve feature matching over wide baselines. While recent work has successfully used affine correspondences to solve various relative camera pose estimation problems, less attention has been given to their use in absolute pose estimation. We introduce the first general solution to the problem of estimating the pose of a calibrated camera given a single observation of an oriented point and an affine correspondence. The advantage of our approach (P1AC) is that it requires only a single correspondence, in comparison to the traditional point-based approach (P3P), significantly reducing the combinatorics in robust estimation. P1AC provides a general solution that removes restrictive assumptions made in prior work and is applicable to large-scale image-based localization. We propose two parameterizations of the P1AC problem and evaluate our novel solvers on synthetic data showing their numerical stability and performance under various types of noise. On standard image-based localization benchmarks we show that P1AC achieves more accurate results than the widely used P3P algorithm.
translated by 谷歌翻译
时间序列预测是一项强大的数据建模学科,可以分析历史观察以预测时间序列的未来价值。它已用于许多应用程序,包括但不限于经济学,气象和健康。在本文中,我们使用时间序列预测技术来建模和预测水痘的未来发生率。为了实现这一目标,我们在匈牙利收集的数据集上实现并模拟了多个模型和数据预处理技术。我们证明,在县级预测方面,LSTM模型在绝大多数实验中的所有其他模型都优于所有其他模型,而Sarimax模型在国家一级表现最佳。我们还证明,传统数据预处理方法的性能不如我们提出的数据预处理方法的性能。
translated by 谷歌翻译
Federated learning (FL) has been proposed as a privacy-preserving approach in distributed machine learning. A federated learning architecture consists of a central server and a number of clients that have access to private, potentially sensitive data. Clients are able to keep their data in their local machines and only share their locally trained model's parameters with a central server that manages the collaborative learning process. FL has delivered promising results in real-life scenarios, such as healthcare, energy, and finance. However, when the number of participating clients is large, the overhead of managing the clients slows down the learning. Thus, client selection has been introduced as a strategy to limit the number of communicating parties at every step of the process. Since the early na\"{i}ve random selection of clients, several client selection methods have been proposed in the literature. Unfortunately, given that this is an emergent field, there is a lack of a taxonomy of client selection methods, making it hard to compare approaches. In this paper, we propose a taxonomy of client selection in Federated Learning that enables us to shed light on current progress in the field and identify potential areas of future research in this promising area of machine learning.
translated by 谷歌翻译
Hamiltonian Monte Carlo(HMC)是Markov链算法,用于从具有密度$ e^{ - f(x)} $的高维分布中进行采样,可访问$ f $的梯度。一种特殊的感兴趣的情况是带有协方差矩阵$ \ sigma $的$ d $二维高斯分布,在这种情况下$ f(x)= x^\ top \ top \ sigma^{ - 1} x $。我们表明,HMC可以使用$ \ wideTilde {o}(\ sqrt {\ kappa} d^{1/4} \ log(1/\ varepsilon),使用$ \ varepsilon $ -close在总变化距离中取样。)$渐变查询,其中$ \ kappa $是$ \ sigma $的条件号。我们的算法对哈密顿动力学使用了长时间和随机的整合时间。这与最近的结果(并受到了)的形成对比,该结果给出了$ \ widetilde \ omega(\ kappa d^{1/2})$查询的HMC较低限制,即使是高斯案例,也有固定的集成时间。
translated by 谷歌翻译
单词如何改变他们的含义?尽管语义演化是由多种不同的因素(包括语言,社会和技术方面的)驱动的,但我们发现,有一项法律在五种主要的印欧语语言中普遍存在:这种语义演化非常宽容。使用控制基础对称性的直觉分布语义嵌入的自动管道,我们表明单词遵循含义空间中的随机轨迹,具有异常扩散指数$ \ alpha = 0.45 \ pm 0.05 \ pm 0.05 \ pm 0.05 $ 0.05 $,相反,与扩散的粒子相比之下\ alpha = 1 $。随机化方法表明,在语义变化方向上保留时间相关性是为了恢复强烈延伸的行为所必需的。但是,变化大小的相关性也起着重要作用。我们此外表明,在数据分析和解释中,强大的亚扩散是一种强大的现象,例如选择拟合位移平均值或平均单个单词轨迹的最佳拟合指数的选择。
translated by 谷歌翻译
在非结构化环境中工作的机器人必须能够感知和解释其周围环境。机器人技术领域基于深度学习模型的主要障碍之一是缺乏针对不同工业应用的特定领域标记数据。在本文中,我们提出了一种基于域随机化的SIM2REAL传输学习方法,用于对象检测,可以自动生成任意大小和对象类型的标记的合成数据集。随后,对最先进的卷积神经网络Yolov4进行了训练,以检测不同类型的工业对象。通过提出的域随机化方法,我们可以在零射击和单次转移的情况下分别缩小现实差距,分别达到86.32%和97.38%的MAP50分数,其中包含190个真实图像。在GEFORCE RTX 2080 TI GPU上,数据生成过程的每图像少于0.5 s,培训持续约12H,这使其方便地用于工业使用。我们的解决方案符合工业需求,因为它可以通过仅使用1个真实图像进行培训来可靠地区分相似的对象类别。据我们所知,这是迄今为止满足这些约束的唯一工作。
translated by 谷歌翻译
在医学图像分析中,皮质区域的自动分割一直是长期以来的挑战。皮质的复杂几何形状通常表示为多边形网格,其分割可以通过基于图的学​​习方法来解决。当对受试者之间的皮质网格对齐时,当前方法会产生明显较差的分割结果,从而限制了它们处理多域数据的能力。在本文中,我们研究了E(n) - 等级图神经网络(EGNN)的实用性,将其性能与普通图神经网络(GNNS)进行了比较。我们的评估表明,由于GNN的能力利用全球坐标系的存在,GNNS在对齐网格上的表现要优于对齐网格。在未对准的网格上,普通GNN的性能大大下降,而e(n) - 等级消息传递通过相同的分割结果。也可以通过在重新调整数据(全球坐标系中的共注册网格)上使用普通GNN来获得最佳结果。
translated by 谷歌翻译
基于变压器的语言模型如BERT在大量英语基准上表现出以前的模型,但他们的评估通常限于英语或少量资源的语言。在这项工作中,我们在伯特家族上评估了各种尿潴留的单语,多语言和随机初始化的语言模型,包括爱沙尼亚,芬兰语,匈牙利语,erzya,Moksha,Karelian,Livvi,Komi Permyak,Komi Zyrian,Northern S \' ami,和skolt s''mi。当单晶模型可用时(目前只能等,FI,HU),这些在其母语上表现更好,但一般来说,它们比共享相同字符集的基因无关语言的多语言模型或模型转移。值得注意的是,即使没有特殊努力对封路计优化的特殊努力,高资源模型的直接转移会产生似乎是少数民族尿路语言的艺术POS和NER工具的似乎是有足够的芬特数据的态度。
translated by 谷歌翻译